Position play in carom billiards as a Markov process 



Mathieu Bouville 

Institute of Materials Research and Engineering, 3 Research Link, Singapore 1 1 7602 
email address: m-bouville@imre.a-star.edu.sg 



Summary. Position play is a l<ey feature of carom billiards: on easy shots players can 
manage to score while ensuring that the next position will be favorable. The difficulty of a 
shot therefore depends on the previous shot, e.g. an easy shot generally follows an easy shot. 
We introduce a Markov process which accounts for such correlations. This model can explain 
the long series of easy shots and the high scores which ensue. It also enables us to identify 
differences in the scoring patterns of players at different skill levels. Players can use this model 

via http: //billiards .mathieu. bouville .name/biMar/ 
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1. Introduction 

The word "billiards" can refer to cue games in general — including pool and snooker — or it 
can refer to a specific game, also called "carom billiards" or "carom" . This game is played 
with three balls on a pocketless table (a short glossary is provided as an appendix). A 
player must make his cue ball contact with the two object balls. If he succeeds he scores 
a point and plays again. At the end of the game an average can be obtained by dividing 
the number of points by the number of innings. Rankings can be thus established, even for 
players who never played against one another. This is similar to track and field where times 
or distances can be compared to rank athletes who never competed against one another. 



/ . / . Historical background 

In 1880, in Paris, the American Slosson scored 1 103 points in a row against the French 
Vignaux who then ran 1 531 points. Ten years later Schafer scored 3 000 points in a row. 
This corresponds to playing for days without missing. Such scores are possible because 
when players manage to gather the balls close to a rail and keep them together they can 
have very long runs (series of shots without missing). This technique is called the rail nurse. 
The players could not play for hours without missing if they had to face many difficult shots. 
To prevent the use of the rail nurse technique — and thus avoid tediously long matches — 
new rules were introduced. In balkline the balls cannot be left in the same area of the table 
for more than one or two shots; long series (hundreds of points) can still be obtained by 
playing position. In cushion games the cue ball must hit one rail (one-cushion billiards) or 
three rails (three-cushion billiards) before it contacts the second object ball. 



1.2. Carom billiards as a Bernoulli process 

The g ame of billiards has bee n stud i ed in detail from a mechanics point of view bv lCoriolisI 
l|1835ri and more recently by IPetid l)l996fl . The study of the statistics of billiards on the 
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Fig. 1. The probability to score at least n points, tin, as a function of n for (a) B. Villiers playing 47/2 
balkline and (b) R. Ceulemans playing three-cushion. Diamonds: data; dashed lines: Bernoullian 
model; solid line: IVIarkovian model. 



other hand has been limited to assuming a Bernoulli process. Let /z„ the probability to 
score at least n points. In a Bernoulli process with a success rate A, for all n > 



= A" 



(1) 



The average length of a run — subsequently called "the average" — is then to = A/(1 — A). 
Figure 1(a) shows 47/2 balkline results for Bernard Villiers, based on 69 complete innings 



(innings which were interrupted because Villiers reached 200 points and won the match are 
not included). The Bernoullian model (dashed line) is a poor fit to the data (diamonds): it 
overestimates the importance of short runs and underestimates that of long runs. 



I. 3. The importance of position play 

A Bernoulli process does not account for position play, which is a very important feature 
of straight-rail and balkline billiards for instance. The probability to make a shot depends 
on its difficulty, which is not necessarily random. On easy shots, scoring is not an issue 
and the player can try to play in a way such that the point will be scored and the balls 
will end in a favorable position for the next shot. This is called playing position. After 
an easy shot, one can therefore obtain a shot easier than average. A player can thus have 
a series of easy shots and long runs. Such correlations are completely absent from the 
Bernoullian model described above; it can therefore not properly de scribe carom billiards . 
Even though some limitations of this model have been considered l|Fravl l2002l : iBouvillj . 

II. 004) the effect of position play has never been studied. In order to account for correlations 
between successive shots we model carom billiards as a Markov process. 



2. Carom billiards as a Markov process 

2. 1. Defining a Markov process 

If one considers that there exist A^o possible positions of the balls on the table, the outcome of 
a shot can be either success with the balls ending in one of the A^o possible configurations or 
failure. The probability to score and the positions of the balls for the next shot depend only 
on the position of the balls at the beginning of the shot, not on where they were earlier in the 
game. Thus the succession of shots is a Markov process with A^o + 1 states. Unfortunately 
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the transition probabilities are many, O(iVo^), and cannot be readily obtained. In order 
to simplify the model and make it tractable, similar positions can be treated together in 
order to have only N types of positions. If N is small, the number of parameters is more 
manageable and these parameters can be calculated and interpreted concretely. 

2.2. The probability to score at least n points 

Let P,i the A^-dimcnsional vector whose component i is the probability of having the balls 
in a position of type i after shot n (we use "shot of type i" and "position [of the balls on the 
table] of type i" as synonyms). For all n > the sequence (P„) obeys P„+i = KPn. The 
component kij of the N x N matrix K is the probability to score from a shot of type j with 
the next shot being of type i. K is akin to a transition matrix: the state corresponding to 
"misses" is not included as the corresponding components can straightforwardly be obtained 
from K. The probability to miss a shot of type i is 1 — k^, where Ki — kji is the probability 
to score on a shot of type i. 

In what follows we use N — 2; however the model can straightforwardly be extended to 
more types of shots. Let pi < p2 the eigenvalues of K, and Vi and V2 its eigenvectors. For 
all n > 0, P„ can be written as 

^0-'(i»„). P) 

where po is the probability that the first shot which the player has to play be difficult. The 
probability to score at least n points, /i„, is the sum of the components of P„. For all n > 0, 
fin is of the form 

= (i-r)pi" + rp2" (3) 

where K is a scalar known as a function of Vi, V2, and pq. Figure [l (a) | shows pn on a semi- 
logarithmic scale as a function of n for B. Villiers playing 47/2 balkline: the data follow an 
exponential law at low n and another exponential at high values of n. The Markov process, 
Eq. ©, provides a better description of balkline than the Bernoulli process, Eq. 
The average is the sum over n of /i„ , 

m^{l-Y)-f^ + Y-P^. (4) 

1 - Pi 1 - P2 

As Y can be written as a function of pi, p2, and to, Eq. ^ can be rewritten to have pn as 
a function of pi, p2, to, and n. As the average, to, is known from score sheets, (pn) depends 
on two unknown parameters only, pi and p2- We find them by minimizing the sum of the 
squares of the differences between /z„ from the data and Eq. 

2.3. Types of shots 

We considered that there exist two types of shots, defined the matrix K, and used its 
eigenvectors pi and p2 to calculate pn in Eq. JSJ. However we never really specified what 
these two types of shots are. They cannot be random, otherwise the Markov process would 
boil down to a Bernoulli process. Positions of type 1 (resp. 2) must be such that they 
are generally followed by another position of type 1 (resp. 2). In straight-rail, shots of 
type 2 would be rail-nurse positions: there is a high probability that a rail-nurse position 
be followed by another rail-nurse position. Shots of type 1 would be positions of the balls 
which are less favorable. More generally positions of type 1 are "difficult" and those of 
type 2 "easy" . 
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Fig. 2. The probability to score at least n points, /in, as a function of (- In A)n, with A = m/(m + 1). 
(a): data for 25 French 47/2 balkline players with averages between 5 and 35. (b): three composite 
players (full symbols: players with an average higherthan 25, empty symbols: 15 < m < 25, crosses: 
m < 15). The dashed lines correspond to Bernoulli model. The solid line has a slope of —0.6. 



3. Comparing players 

We would like to use the model to compare players playing at different skill levels: are the 
better players better in every respect or is there one difference which makes them better? 
For such a comparison one needs to cancel the effect of the difference between their averages. 



3. 1. Dedimensionnalization 

In the Bernoulli model, Eq. /i„ = exp(rtlnA). Letting v = (— lnA)n, /i„ is equal to 
exp(— i^). If m is large, n/m: the length of the runs is thus measured as a fraction of 
the average. This provides a way to compare players with different averages. Figure 2 (a 
represents /i„ as a function of (— InA)?!. The results are very similar even for players of 
quite different skill levels (data are for players with averages between 5 and 35). In order 
to determine what differentiates the better players from the less good, we create three 
composite players. We use the scores of players with an average higher than 25 to create 
a "player" who played about 400 innings and who has an average of 30.4. Likewise, we 
use the scores of players with an average between 15 and 25 (700 innings, m = 20.5) and 
of players with an average lower than 15 (500 innings 
the scores of these three "players" 



= 10.7). Figure [2(bJ 



represents 

There is no noticeable difference between them. The 
variations seen in Fig. 2(a) therefore come from variations between players at the same skill 
level, not from differences between the better and less good players. 



3.2. Difference between players at different skill levels 

The slope of the asymptote to (ln/i„) for large values of (— lnA)rt is — (lnp2)/(ln A). 
Figure 2(b) shows that the slope of the asymptotes is close to —0.6 (solid line). Thus 



P2 



A' 



0.6 



(5) 



for all three "players" . As most points are scored on easy shots, there logically exists a 
correlation between p2 and the average (and thus A). As difficult shots contribute little to 
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the average, the correlation between pi and the average is weak and one cannot express pi 
as a function of A as can be done with p2- 

If the opponent always left an easy shot then the average would be close to p2/(l ^ ^2)- 
Let 7712 the contribution to the average of runs beginning with a shot of type 2, m2 ~ 
(1 —po) A'''^/(l — A°'^). Since m2/rn is a decreasing function of A the weaker players mostly 
score when their opponents leave them easy shots whereas better players also score on runs 
beginning with a difficult shot. 



3.3. The ca se of three-cushion 

Figure 1(b) shows In function of n for Raymond Ceulemans at the 1978 three- 

cushion world championship, where he played 382 innings and won all his matches and 
the tournament. Raymond Ceulemans — probably the best player of all times — has more 
than 100 titles (world, Europe and Belgium) and he won 17 of the 18 three-cushion world 
championships held between 1963 and 1980. Even for Ceulemans at the peak of his career 
three-cushion is a difficult game and, unlike what was observed in Fig. 1(a) for Villiers 
playing balkline, the results of Ceulemans are rather close to a Bernoulli process, i.e. to the 
results of a player who would not play position at all. A Bernoulli process seems sufficient 
for three-cushion billiards. 



4. Calculating the scoring probabilities 

4.1. An underdefined system 

We would like to calculate the scoring probabilities, i.e. the matrix K, of a player from his 
scores. However, the system is underdefined: the five unknowns (the four components of K 
and Po) lead to only three measurable parameters (to and the eigenvalues pi and p2). One 
can therefore not know K unambiguously. All we can do is write K as a function of pi, p2, 
TO, and two free parameters, e.g. ki2 and pq. These cannot take any arbitrary values: for 
any (i, j) pair, < kij < 1 and kij + k2j < 1. These constraints give a range of possible 
values for ki2 and po and thence for K. In spite of these constraints there is a wide range 
of possible values for K: for Bernard Villiers playing 47/2 balkline one can have 

AO.7% 0.0%\ _ A3.5% 4.8%\ 

{ 0.0% 98.0%) - 1^32.2% 95.2%/ 



4.2. A Markov process with N types of shots 

Equation Q shows that, if iV 2, (/i„) is the sum of two geometric sequences. In the 
general case, (pn) is a sum of N geometric sequences. If we choose a value for N higher 
than 2 the number of unknown is iV^ -f iV — 1 and the number of relationships between 
them is + 1. This leaves A^^ — 2 free parameters, i.e. two free parameters if A^ = 2 but 
seven if A^ = 3. In Fig. 1(a) there does not seem to be more than two exponentials: there 
is no need to have N > 2. This is fortunate as it implies that there is no need to deal with 
seven or more free parameters. 



4.3. The different types of positions 

The uncertainties in expression jnj come mostly from the wide range of possible values of 
Po- If the value of po could be set then iT would be known more precisely. Setting po defines 
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Fig. 3. (color) The average for pi = 0.4 and p2 = 0.8. In (a) the proportion of difficult shots left by 
the opponent ispo = 0, in (b) po = 1/2, and in (c) po = 1- 



what easy and difficult shots are: it determines how easy a shot must be to be of type 2. 
If po is small then most shots are easy whereas most shots are difficult if po is large. We 
say that "easy shots" are shots easier than the median of the probability to score. Then by 
definition 50% of the shots are easy and 50% are difficult. In the remainder of this section, 
we consider only cases such that po = 1/2- 

For Bernard Villiers playing 47/2 balkline, if po = 1/2 then 

AO.9% ± 0.2% 1.2% ± 1.2%\ 
1^11.5% ±1.2% 97.8% ±0.2%/ 

There remain uncertainties because after setting po there still is a free parameter. However 
these uncertainties are much smaller than those of Eq. ©, especially the one on /c2i- 



4.4. How players can use this model 

The page http : //billiards . mathieu . bou ville . name/biMeir /[ allows players to calculate 
their matrix K from their scores. The program calculates the eigenvalues by the conjugate 
gradient method. It then deduces the possible ranges for the components of the matrix K 
as was done with expression ^ using the scores of B. Villiers. The user provides data in 
two columns, the first one is a number of points per inning and the second column is the 
number of occurrences of this score. The input and the result, the probabilities to have 
an easy/difficult shot after an easy/difficult shot, are straightforward enough. Players need 
neither understanding of the model nor mathematical background to obtain this result. 



4.5. Strategy of the opponent 

The first shot played by a player is the shot his opponent left him. It may not be random, 
e.g. if the opponent has a defensive style he may leave mostly difficult shots. Figure |31 
shows the average if pi = 0.4 and p2 = 0.8, for three types of opponents. Since the average 
is not set there are two free parameters; we use Ski = k2i — fcn and Ski = ^22 — ^12- In 
Fig. 



3(a) the first shot the player has to play is always easy. 



In Fig. 3(c) the opponent 
leaves only hard shots and half easy half hard in Fig. 3(b) If 5ki — —0.4 and Ski = 0.8 the 
average varies tremendously depending on the strategy of the opponent. For Ski — —0.8 
and Ski = on the other hand the average is independent of the opponent. This provides 
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extra information: if for a given player one knows pi, p2 and how he fares against various 
kinds of opponents one can reduce the span of possible values of K. 

5. Conclusion 

We presented a new model of carom billiards which accounts for position play. Using a 
Markov process the probability to score is correlated to the difficulty of the previous shot. 
The probability to score at least n points is then a sum of two geometrical sequences. 
The Bernoulli process which was used so far is a particular case of the present model 
with a single geometrical sequence. Using this Markov model we established that better 
players score a greater proportion of their points from difhcult positions left by their 
opponents than weaker players. The players can easily use the model through the web 
pagejhttp: //billiards .mathieu.bouville .naime/biMarTl 
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Glossary 

balkline: games in which the balls cannot be kept in the same zone of the table for more 
than one or two shots in a row. The three kinds of balkline are 47/2, 47/1, and 71/2. 

cushion games: games in which the cue ball must hit a certain number (one or three) of 
rails (cushions) before it hits the second object ball. 

playing position: trying not only to score but also to get a favorable position on the next 
shot, in order to have only easy shots to play and long runs (e.g., the rail nurse). 

rail nurse: in straight-rail, the player gathers the balls close to a rail in order to have a 
series of easy shots resulting in a very long run. 

run: series of points without missing. Length of that series, as in "a run of 10" . 

straight-rail billiards: the easiest version of the game in which a point is scored when 
the cue ball contacts both object balls, without any additional constraint. 
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Le replacement au billard carambole comme processus 
de Markov 
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Resume. Le replacement est la pierre angulaire des jeux de series au billard carambole 
(billard frangais) : sur un coup facile le joueur peut marquer tout en s'assurant que le coup 
suivant sera favorable. Un coup facile est ainsi generalement suivi d'un autre coup facile. La 
difficulte d'un coup depend done du coup precedent. On presente un processus de IVIarkov qui 
tient compte de ces correlations. Ce modele permet d'expliquer les longues series de coups 
faciles et les scores eleves qui en resultent. II permet aussi d'identifierdes differences dans la 
nature des points sur lesquels des joueurs de niveau different marquent le plus. Les joueurs 

peuvent Utiliserce modele via la page http : //billiards . mathieu . bo uville . name/biMar/, 

Keywords: billard, sport, processus de IVIarkov, processus de Bernoulli 



1. Introduction 

Le billard carambole (ou « billard frangais ») se joue avec trois billes sur une table sans 
poches (un court glossaire est propose en annexe.) Si la bille du joueur touche les deux 
autres billes le joueur marque un point et rejoue. Quand il manque c'est au tour de son 
adversaire de jouer. A la fin de la partie on peut calculer une moyenne en divisant le nombre 
de points marques par le nombre de reprises. Des classements peuvent ainsi etre etablis, 
meme pour des joueurs qui n'ont jamais joue I'un centre I'autre ; comme en athletisme oii 
temps et distances sont compares pour classer des athletes qui ne se sont jamais rencontres. 



1.1. Historique 

En f880, a Paris, I'americain Slosson a marque f f03 points d'afRle face au frangais 
Vignaux qui a alors marque 1 531 points. Dix ans plus tard Schafer marquait 3 000 points. 
Ceci correspond a jouer pendant des jours sans manquer. De tels scores sont possibles 
car quand les joueurs parviennent a regrouper les billes pres d'une bande et a les garder 
ensemble ils peuvent avoir de tres longues series. Cette technique s'appelle I'americaine. Les 
joueurs ne pourraient pas jouer pendant des heures sans manquer s'ils devaient faire face 
a de nombreux points difhciles. Pour empecher les joueurs d'utiliser I'americaine — et ainsi 
eviter les parties fastidieusement longues — de nouvelles regies ont ete introduites. Dans les 
jeux de cadres il est interdit de laisser les billes dans un certain secteur de la table pendant 
plus d'un ou deux coups ; de longues series (centaines de points) sont encore possible grace 
au replacement. Une autre maniere de compliquer le jeu est d'imposer au joueur de toucher 
un certain nombre de bandes avant que sa bille n'entre en contact avec la troisieme bille. 



1.2. Le billard carambole comme processus de Bernoulli 

Le billard a ete etudie en detail d'un point de vue mecanique par lCoriolisI 1(183,4 1 puis plus 
recemment par IPetitI 1 199(]t ). L'etude des statistiques du billard a en revanche ete hmitee a 



2 M. Bouville 




(a) 100.0% i 



(b) 



Fig. 1 - la probabilite de marquer au moins n points, en fonction de n pour Villiers 
au cadre 47/2 (a) et Ceulemans au trois-bandes (b). Losanges : donnees; lignes pointillees : 
modele bernouUien ; ligne continue : modele markovien. 



supposer un processus de Bernoulli. Soit /i„ la probabilite de marquer au moins n points. 
Pour un processus de Bernoulli avec un taux de reussite A le terme general de est 



fJ-n 



A". 



(1) 



La longueur moyennc d'une serie — ci-apres appelee « la moyenne » — vaut 771 = A/(l — A). 



La figure 1(a) represente des resultats de Bernard Villiers au cadre 47/2, bases sur 69 scries 
completes (les series qui ont ete interrompues parce que Villiers a atteint 200 points et 
gagne le match ne sont pas comptabilisees) . Le modele bernouUien (pointilles) donne des 
resultats tres difFerents des donnees (losanges) : il surestime I'importance des courtes series 
et sous-estime celle des longues series. 



1.3. L'importance du replacement 

Un processus de Bernoulli nc tient pas compte du replacement, qui est tres important 
dans les jeux de series. La probabilite de marquer un point depend de sa difficulte, qui 
n'est pas necessairement aleatoire. Sur les coups faciles, marquer n'est pas un probleme et 
le joueur pent essayer de jouer d'une maniere telle que le point sera marque et la position 
finale des billes sera favorable. Ceci s'appelle le replacement. Apres un coup facile, on pent 
done obtenir un coup plus facile que la moyenne. Un joueur pent avoir une serie de coups 
faciles et de tres longues series. De telles correlations sont completement absentes du modele 
bernouUien decrit ci-dessus ; il ne pent done decrire correcte ment les ieux de series. S i 
quelques limitations du modele bernouUien ont ete considerees ((FravL l2f)02 : iBouvillel l2004l ) 
I'efFet du replacement n'a jamais ete etudie. 

2. Le billard carambole comme processus de Markov 

2. 1 . Definir un processus de Markov 

Si on considere qu'il existe iVo positions possibles des billes sur la table, le resultat d'un 
coup pent etre un succes avec les billes finissant dans une des Nq configurations possibles ou 
un echec. La probabilite de marquer et la position des billes pour le prochain coup dependent 
seulement de la position des billes au debut du coup, pas de leur position anterieure. La 
succession des coups est done un processus de Markov a iVg + 1 etats. Malheureusement les 
probabilites de transition sont nombreuses, O(A^o^), et ne peuvent etre aisement obtenues. 
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Pour simplifier le modele et le rendre utilisable, on peut regrouper des positions similaires 
pour n'avoir que N types de positions. Si N est petit, les parametres sont sufBsamment peu 
nombreux pour pouvoir etre calcules et interpretes concretement. 



2.2. La probabilite de marquer au mains n points 

Soit P„ le vecteur a N dimensions dont la composante i est la probabilite que les billes 
soient dans une position de type i apres le coup n (on utilise « coup de type i » et « position 
[des billes sur la table] de type i » comme des synonymes). Pour tout n > la suite (P„) 
obeit a Pn+i — KPn- L'element kij de K, matrice N x N, est la probabilite de marquer sur 
un coup de type j et que le prochain coup soit de type i. K est apparentee a une matrice de 
transitions : I'etat correspondant a un manque n'est pas inclus car les composantes afferentes 
peuvent etre obtenues simplement a partir de K. La probabilite de manquer un coup de type 
z est 1 — Ki, oil Ki — J2j kji 6st la probabilite de marquer sur un coup de type i. 

Dans ce qui suit on utilise N = 2 mais le modele peut aisement etre etendu a plus de 
types de coups. Soient pi < p2 les valeurs propres de K et Vi et V2 les vecteurs propres 
associes. Pour tout n > 0, P„ s'ecrit 

p.. = {v, v,)('';" ;„){v, v.)-'(i!;J. (2) 

Po est la probabilite que le premier point joue par le joueur soit difficile. La probabilite de 
marquer au moins n points, est la somme des composantes de P„. Pour tout n > 0, /i„ 
est de la forme 

= (1 - y)pr + Yp^, (3) 



Y est un scalaire connu en fonction de Vi, V2 et po- La figure 1(a) presente /i„ sur une 
echelle semi-logarithmique en fonction de n pour Bernard Villiers au cadre 47/2 : les donnees 
suivent une exponentielle pour les petits n et une autre aux valeurs elevees de n. Le processus 
de Markov, equation J^J, est une meilleure description des jeux de cadres que le processus 
de Bernoulli, equation 

La moyenne, m, est la somme sur n de 

m = (i-y)-^ + y-^. (4) 

1 - Pl 1- P2 

Comme Y est connu en fonction de pi, p2 et m, I'equation ((SJ peut etre reecrite en exprimant 
/i„ en fonction de pi, p2, m et n. Comme la moyenne est connue grace aux feuilles de matches 
(pn) ne depend que de deux inconnues, pi et p2. On trouve leur valeur en minimisant la 
somme des carres des differences entre la valeur de p„ des donnees et celle de I'equation (jSJ. 



2.3. Types de coups 

On a considere qu'il existe deux types de coups, defini la matrice K et utilise ses vecteurs 
propres pi et p2 pour calculer /i„ dans I'equation Mais on n'a jamais vraiment specifie 
ce que sont ces deux types de coups. lis ne peuvent pas etre aleatoires, sinon le processus de 
Markov se reduirait a un processus de Bernoulli. Les positions de type 1 (resp. 2) doivent 
etre telles qu'elles sont generalement suivies d'une autre position de type 1 (resp. 2). A la 
libre, les coups de type 2 seraient des positions d'americaine : il y a une grande probabilite 
qu'une position d'americaines soit suivie d'une autre position d'americaine. Les coups de 
type 1 seraient les positions moins favorable des billes sur la table. Plus generalement les 
positions de type 1 sont « difficiles » et celles de type 2 « faciles ». 
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Fig. 2 - La probabilite de marquer au moins n points, en fonction de {— lnA)n. (a) : 
donnees de 25 joueurs frangais de cadre 47/2. (b) : trois joueurs composites (symboles 
pleins : joueurs de moyenne superieure a 25, symboles vides : 15 < m < 25, croix : m < 15). 
Les lignes pointillees correspondent au modele bernouUien. La ligne continue a une pente 
de -0,6. 



3. Comparaisons de joueurs 

On aimerait utiliser le modele afin de comparer des joueurs de niveaux differents : les 
meilleurs sont-ils meilleurs en out ou bien y a-t-il une difference qui les rend meilleurs ? 
Pour une telle comparaison il faut annuler I'effet de la difference de leurs moyennes. 



3. 1. Dedimensionnalisation 

Dans le modele bernouUien, equation (Q, /i„ ~ exp(nlnA). En posant v — (— lnA)n, 
est egal a exp(— j/). Si m est grand, ly ^ n/m; la longueur dcs scries est ainsi mesuree 
en pourcentage de la moyenne. La figure |2'(a)| represente fin en fonction de (— lnA)n. Les 
resultats sont tres similaires meme pour des joueurs de niveaux tres differents (les donnees 
sont pour des joueurs de moyenne comprise entre 5 et 35). Afin de determiner ce qui 
differencie meilleurs et moins bons, on cree trois joueurs composites. On utilise les scores 
de joueurs de moyenne superieure a 25 afin de creer un « joueur » ayant joue environ 400 
reprises pour une moyenne de 30,4. De meme on utilise les scores de joueurs ayant entre 
15 et 25 de moyenne (700 reprises, m — 20, 5) et de joueurs de moyenne inferieure a 15 
(500 reprises, m = 10, 7). La figure 2(b) represente les scores de ces trois « joueurs ». II n'y 
a pas de difference notable entre eux. Les variations de la figure 2(a) proviennent done de 
variations entre joueurs de meme niveau et non de differences entre meilleurs et moins bons. 



3.2. Difference entre joueurs de niveau different 

La pente de I'asymptote de (ln/i„) pour les grandes valeurs de (—In \)n est — (In p2)/{ln A). 
La figure 2(b) montre que la pente des asymptotes est —0,6 (ligne continue). On a done 



P2 



A" 



(5) 



pour ces trois « joueurs ». Comme la plupart des points sont marques sur des coups faciles, 
il existe logiquement une correlation entre p2 et la moyenne, done A. Les coups difficiles 
contribuant peu a la moyenne, la correlation entre pi et la moyenne est faible et on ne pent 
exprimer pi en fonction de A comme on peut le faire avec p2. 
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Si I'adversaire laissait toujours un coup facile la moyenne serait d'environ /52/(l ^ ^2)- 
Soit 7712 la contribution a la moyenne des series commengant par un coup de type 2, 
7772 « (1 ~ Po) A°'®/(1 — A°'®). Comme 7772/771 est une fonction decroissante de A les joueurs 
les moins bons marquent principalement quand leur adversaire leur laisse un coup facile 
alors que les meilleurs marquent aussi sur des series faites a partir d'une position difficile. 



3.3. Cas du trois-bandes 



La figure 1 (b) represente In /i„ en fonction de 77 pour Raymond Ceulemans au 
championnat du monde de trois-bandes 1978 011 il a joue 382 reprises, remportant tous 
ses matches et le titre. Raymond Ceulemans — probablement le meilleur joueur de tous les 
temps — a plus de 100 titres (mondiaux, europeens et beiges) et a gagne 17 championnats du 
monde de trois-bandes sur 18 entre 1963 et 1980. Meme pour Ceulemans au sommet de sa 



carriere le trois-bandes est difficile et, a la difference de ce qui a ete observe sur la figure 1(a) 



pour Villiers jouant au cadre, les resultats de Ceulemans sont proches d'un processus de 
Bernoulli, c'est-a-dire des resultats d'un joueur qui ne jouerait pas du tout le replacement. 
Lc modele bernouUien semble done suffire dans le cas du trois-bandes. 



4. Calcul des probabilites de marquer 

4.1. Un systeme sous-defini 

On aimerait calculer les probabilites de marquer (la matrice K) a partir de ses scores. 
Cependant le systeme est sous-defini : les cinq inconnues (les quatre elements de Ket po) ne 
debouchent que sur trois parametres mesurables (777 et les valeurs propres pi et p2). On ne 
pent done pas determiner K uniquement. On ne pent qu'ecrire K en fonction de pi, p2, m 
et de deux parametres fibres, par exemple fci2 et pq. lis ne peuvent pas prendre n'importe 
quelle valeur : pour tout («, j) on doit avoir < kij < 1 et kij -\- k2j < 1. Ces contraintes 
donnent un intervalle de valeurs possibles pour ki2 et po puis pour K. Malgre ces contraintes 
il existe de nombreuses valeurs possibles de K : pour B. Villiers au cadre 47/2 on peut avoir 

43, 5 % 4, 8 %\ , . 

32,2% 95,2%/ 



K = 



40,7% 0,0% 
0, % 98, % 



on K = 



4.2. Un processus de Markov avec N types de coups 

L'equation Q montre que si = 2 (/i„) est la somme de deux suites geometriques. 
Dans le cas general, (/i„) est la somme de N suites geometriques. Si on choisit une valeur de 
N superieure a 2 le nombre d'inconnues est de N'^ -I- — 1 et le nombre de relations entre 
elles de + 1. Ceci laisse N'^ — 2 parametres fibres : deux parametres fibres si = 2 mais 
sept si A^ = 3. Sur la figure 1(a) il ne semble pas y avoir plus de deux exponentielles : on 
n'a pas besoin d'avoir N > 2. C'est heureux car ga signifie qu'il n'est pas necessaire d'avoir 
sept parametres fibres (ou plus). 



4.3. Les differents types de positions 

Les incertitudes dans I'expression (jSJ proviennent surtout du large intervalle de valeurs 
possibles pour pq. Si on fixe po alors if est connue plus precisement. La valeur de po definit 
ce que sont les coups faciles et difficiles : elle determine quelle niveau de facilite est requis 
pour qu'une position soit de type 2. Si po est petit la plupart des coups sont faciles alors que 
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Fig. 3 - (couleur) La moyenne pour p\ — 0.4 et pi — 0.8. En (a) la proportion de coups 
difficiles laisses par I'adversaire est de po = 0, en (b) po = 1/2 et en (c) po = 1- 



la plupart des coups sont difRciles si po est grand. On dit que les « coups faciles » sont des 
coups plus faciles que la mediane de la probabilite de marquer. Alors par definition 50 % 
des coups sont faciles et 50 % difficiles. Dans ce qui suit on se limite done au cas po = 1/2- 
Pour Bernard Villiers jouant au cadre 47/2, si po = 1/2 

_ /40, 9 % ± 0, 2 % 1, 2 % ± f , 2 %\ 
i^ff,5%±f,2% 97,8% ±0,2%/ 

Des incertitudes demeurent vu qu'apres avoir fixe po il y a encore un parametre fibre. Ces 
incertitudes sont tout de meme bien plus faibles que celles de I'equation lO, surtout ^21. 



4.4. Comment les joueurs peuvent utiliser ce modele 

La page http : //billiards .mathieu. bouville .name/biMar/ permet aux joueurs de 
calculer leur matrice K a partir de leurs scores. Le programme calcule les valeurs propres 
par la methode du gradient conjugue. II en deduit I'intervalle possible des elements de la 
matrice if comme on a fait pour B. Villiers dans I'expression Q. L'utilisateur fournit des 
donnees en deux colonnes, la premiere est un nombre de points par reprise et la seconde est 
le nombre de fois oil ce score a ete obtenu. Ces donnees ainsi que le resultat, la probabilite 
d'obtenir un coup facile/difficile apres un coup facile/difficile, sont assez simples. Le joueur 
n'a pas besoin de connaitre le modele ni les mathematiques pour obtenir ce resultat. 



4.5. Strategie de I'adversaire 

Le premier coup joue par un joueur est le coup laisse par son adversaire. II n'est pas 
forcement aleatoire : si I'adversaire joue defensivement, il laissera souvent les billes dans 
une position difficile. La figure 13 represente la moyenne si pi =0,4 et p2 — 0,8, pour trois 
types d'adversaires. Comme la moyenne n'est pas fixee il y a deux parametres libres; on 
utilise Ski = ^21 — fcn et dk2 — ^22 — ^12- Pour la figure 3(a) le premier coup que le joueur 
doit jouer est toujours facile. Dans le cas de la figure 3(c) I'adversaire laisse seulement des 
coups difficiles et moitie moitie pour la figure 3(b) Si Ski ~ —0, 4 et Sk2 = 0, 8 la moyenne 
depend fortement de la strategie de I'adversaire. Quand Ski ~ —0, 8 et 5k2 = en revanche 
la moyenne est independante de ce que fait I'adversaire. Ceci fournit des informations 
supplementaires : si pour un joueur donne on connait pi et p2 et comment il se comporte 
contre divers joueurs il est possible de reduire le nombre de valeurs possibles de K. 
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5. Conclusion 

On a presente un nouveau modele du billard carambole qui tient compte du replacement. 
En modelisant les jeux de series comme un processus de Markov la probabilite de marquer 
un point est correlee a la diSiculte du coup precedent. La probabilite de marquer au 
moins n points est alors une somme de deux suites geometriques. Le processus de 
Bernoulli est un cas particulier du present modele avec une seule suite geometrique. 
En utilisant ce modele markovien on a pu etablir des differences entre joueurs de 
differents niveaux : les meilleurs joueurs marquent une plus grande proportion de leurs 
points sur des positions difficiles laissees par leur adversaire que les moins bons. La 
page |http : / /billiards . mathieu . bouville . name/biMar/ permet aux joueurs d'utiliser 
ce modele sans difRculte. 
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Glossaire 

americaine : a la libre, le joueur rassemble les billes a proximite d'une bande afin de 
n'avoir que des coups faciles a jouer et d'obtenir de tres longues series. 

bandes (une bande, trois bandes) : modes de jeu oii la bille du joueur doit entrer en 
contact avec un certain nombre de bandes (une ou trois) avant de conclure le point. 

cadres : trois modes de jeu (47/2, 47/1 et 71/2) oii les billes ne peuvent pas etre laissees 
dans la meme partie du billard pendant plus d'un ou deux coups. 

partie libre (ou libre) : mode de jeu le plus simple dans lequel un point est marque si 
la bille du joueur touche les deux autres billes, sans autre contraintc. 

replacement : fait d'essayer non seulement de marquer le point mais aussi d'obtenir une 
position favorable pour le prochain coup afin de n'avoir que des coups faciles a jouer 
et des scores eleves. L' americaine en est un exemple. 

serie : coups successifs sans manquer. Nombre de points ainsi marques, une serie de 10. 
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